最优贝叶斯分类器:
也就是对每个样本,选择能使后验概率最大的类别标记
目标:求
判别式模型
将误判损失写为:
得到
任务:找到一个判定准则h:以最小化总体风险
此时条件风险变成
条件风险
生成式模型
属性独立性假设
朴素贝叶斯分类器
得到参数的极大似然估计
极大似然估计
对数似然
万一有某个属性值没有与1某个类同时出现过咋办? 连乘导致的属性抹去问题
拉普拉斯修正
贝叶斯判定准则: